RAG(检索增强生成)通过提供来自外部知识源的相关背景来帮助提高 LLM 答案的准确性和可靠性。 Agentic RAG 是高级 RAG 版本,它使用 AI 代理来更加自主地行动。 Agentic RAG 执行以下操作 查询理解、分解和重写 检索策略选择 知识库管理 结果综合与后处理 迭代查询和反馈循环
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 提升大型语言模型(LLMs)的知识获取和生成能力的 Agentic RAG(智能增强检索生成)技术。 虽然智能代理(Agents)可以被整合进 RAG 流水线的不同阶段,但 Agentic RAG 通常特指在检索组件中引入代理技术的实现。 在现代 AI 应用中,尤其是在处理多源知识和实时数据时,Agentic RAG 的灵活性成为其核心优势。Agentic RAG 的核心在于其多层次架构,融合了代理智能、检索技术和生成模型。 以下是 Agentic RAG 框架中代理的关键使用模式,它们共同构成了这一技术在实际应用中的核心价值。 今天的解析就到这里,欲了解更多关于 Agentic RAG 相关技术的深入剖析,最佳实践以及相关技术前沿,敬请关注我们的微信公众号:架构驿站,获取更多独家技术洞察!
在人工智能快速发展的今天,检索增强生成(Retrieval-Augmented Generation,简称 RAG)技术已经成为大语言模型(LLM)应用的关键突破。 那么,如何在日新月异的 RAG 技术下,开发一种能够不断适应的框架呢?今天,我们将深入探讨 Agentic RAG,这一革命性的方法正在重新定义智能信息检索与生成的边界。 本文先讨论 Agentic RAG 常见范式,然后推荐一些流行的 Agentic RAG 开发示例:Nvidia 的 Agentic RAG 案例和基于 LlamaIndex 的 Agentic RAG Agentic RAG 引入了一个关键概念:让 Agent 在整个信息检索和生成过程中主动思考和决策。这不仅仅是一个技术术语,而是一种全新的智能工作范式。 1. 结语 Agentic RAG 不仅仅是一种技术,更是一种思维方式。它代表了从被动检索到主动学习、从静态匹配到动态智能的巨大飞跃。
本文探讨了从RAG到Agentic RAG的演进,展示了: 代理模式:驱动系统适应性和智能的核心原则。 分类:Agentic RAG架构的全面分类。 6.2 GeAR:图增强代理RAG 核心思想:通过图扩展技术和代理架构增强RAG系统。 工作流: 扩展与查询相关的图以增强关系理解。 利用专业化代理进行多跳推理。 RAG代理分类的实现:技术与工具 技术 工具 描述 笔记本 单代理RAG LangChain, FAISS, Athina AI 使用AI代理通过向量数据库和网络搜索找到并生成答案。 纠正RAG 企业系统的代理AI驱动技术故障排除 https://arxiv.org/abs/2412.12006 纠正RAG (CRAG) https://langchain-ai.github.io/ langgraph/tutorials/rag/langgraph_crag/ 纠正检索增强生成 https://arxiv.org/abs/2401.15884 企业系统的代理AI驱动技术故障排除 https
部署Agentic RAG技术解决方案 腾讯云与Elastic(2019年合作,数据截至2025年3月)联合推出Elasticsearch服务,以“稳定基础设施+敏捷上层开发”模式提供Agentic RAG 技术栈: 技术架构:用户查询→Elastic搜索→LLM响应(混元模型)→应用跟踪(RAG仪表板、LLM日志/指标),支持复杂任务下推、声明式语言、100% MCP函数调用。 量化应用效果与客户价值 标杆案例:首个“十亿级向量”RAG应用,服务器从400+降至30,运营成本降低90%+(来源:腾讯云Elasticsearch解决方案案例)。 "Elastic卓越奖庆祝那些使用Elastic在搜索、可观测性和安全领域创造突破性解决方案的人,解决核心复杂性并以深厚技术专长应对最困难业务挑战。" Elastic Excellence Awards INNOVATION AWARD HONOREE及EXCELLENCE AWARDS"(来源:2025年Elastic卓越创新奖) 选择腾讯云的核心优势 技术确定性
、博客); 大家应该就看出来了,他们其实是三种技术路径,并且彼此之间并不是互斥的,比如RAG系统里面大概率有Workflow;Agent很可能既包含Workflow、又包含RAG。 ,为了获取更新、更专业、更隐私的知识,RAG技术应运而生。 我们最后说下Agent 与 RAG 的关系: Agentic RAG 传统的RAG在使用过程中,大家慢慢发现一些问题: 先查向量库; 再 Top-K; 然后塞 Prompt; 最后生成; 流程非常清楚, 很多人开始以为Agentic RAG是一种“新的RAG形态”,但你仔细拆就会发现: 数据怎么存?没变 数据要不要处理?还得清洗 表格怎么处理?还是工程 引用怎么校验?依旧规则 ...... Agentic RAG 是:人设计能力边界 → 模型在边界内调度流程。 这意味着什么?它有效解决了传统RAG在应对复杂、多跳查询时,因流程僵化而导致的信息割裂、证据不全等顽疾。
PageIndex 是一个文档索引系统,它从长文档构建搜索树结构,为基于推理的RAG做好准备。 由Vectify AI开发。 它特别适用于:财务报告、监管文件、学术教科书、法律或技术手册,以及任何超出LLM上下文限制的文档。 json数据 那PageIndex的亮点在哪里呢,其实在最后一部分“使用PageIndex进行基于推理的RAG”的实现,相比之前的Advanced和Modular RAG,Agentic RAG更加智能 案例研究:Mafin 2.5 Mafin 2.5是一个专为财务文档分析设计的最先进基于推理的RAG模型。 它基于PageIndex构建,在FinanceBench基准测试中达到了惊人的98.7%准确率——显著优于传统的基于向量的RAG系统。
GraphRAG、Agentic Retrieval三驾马车重塑RAG技术。 本节为你提供的核心技术价值 2. 传统RAG的痛点 3. 本节为你提供的核心技术价值 掌握2026年Agentic RAG 3.0的核心升级点,通过1M上下文、Multimodal GraphRAG、Agentic Retrieval三驾马车重塑RAG技术,提升系统性能和准确性 RAG的关键技术是什么?" 总结与建议 11.1 总结 Agentic RAG 3.0通过1M+长上下文、Multimodal GraphRAG和Agentic Retrieval三驾马车,彻底重塑了RAG技术,解决了传统RAG的诸多痛点
而Agentic RAG 的思路截然不同,它不急着从检索结果里硬挤答案,而是先判断一下拿回来的东西到底有没有用,如果没用则会重写查询再来一轮。 本文要做的就是用 LangGraph 做流程编排、Redis 做向量存储,搭一个生产可用的 Agentic RAG 系统。涉及整体架构设计、决策逻辑实现,以及状态机的具体接线方式。 Agentic RAG 的解法是在流程中插入检查点:智能体先判断要不要检索;检索完了有评分环节确认相关性;不相关就重写查询再试;如此循环直到拿到合格的上下文,或者把重试次数耗尽为止。 对于已经跑着 Redis 的技术栈来说,加 RAG 能力几乎零额外运维负担。 智能体节点 nodes.py 里有三个核心函数。 智能体函数接收当前状态(用户问题、历史对话等),判断下一步怎么走。 总结 标准 RAG 把检索当黑盒,查询丢进去、文档出来,至于相不相关全凭运气。Agentic RAG 打开这个黑盒在关键位置加了质量控制。
通过本文,您将了解数据投毒的危害,掌握识别和防御数据投毒攻击的方法,为构建安全的RAG和Agentic系统提供保障。 目录 本节核心技术价值 1. 实战案例 5.1 案例一:RAG系统知识库投毒 5.2 案例二:Agentic系统训练数据投毒 5.3 案例三:RAG与Agentic混合系统数据投毒 6. 与Agentic混合系统数据投毒 背景:某公司的系统结合了RAG和Agentic技术,攻击者尝试通过向系统中注入恶意数据来操纵系统的行为。 和Agentic系统面临的重要安全挑战,随着AI技术的发展和攻击手法的演变,防御策略也需要不断更新和完善。 建议企业和研究机构投入更多资源到数据投毒防御领域,开发更先进的防御技术和工具,为RAG和Agentic系统的安全运行提供更可靠的保障。
尽管标准 RAG(检索增强生成)技术已经证明了其在简单查询任务中的卓越表现,但面对更加复杂的信息处理需求时,仍可能受到局限性的制约。这正是 Agentic RAG 应运而生的原因。 4、Agentic Enhancement(代理增强技术) Agentic Enhancement(代理增强技术)的应用赋予了 LLM 和 RAG 前所未有的智能化能力。 基于代理的检索增强生成(Agentic RAG)技术通过引入创新的代理框架,彻底改变了我们回答复杂问题的方式。 引入 Agentic RAG (基于智能代理的检索增强生成)技术的主要原因在于应对传统语言模型和信息检索系统在解决复杂问题时所面临的诸多挑战和局限性。 因此,可以预见,在不远的将来,基于 Agentic RAG 技术的智能系统将大显身手,成为人类在海量杂糅信息中探索知识、获取见解的得力助手。
现在,我们来看一下如何使用Elasticsearch作为知识库,并使用Langchain作为代理框架来实现Agentic RAG。 让我们看看如何修改这个工具以用于RAG。Agentic RAG我最近在Elastic Cloud部署中构建了一个大型且复杂的知识库,使用了POLITICS数据集。 Agentic RAG 的一个优势是我们可以通过多个对话步骤开发答案。换句话说,更复杂的查询可以通过引导问题来设定舞台和上下文。问答变成了基于事实的对话,而不是一次性的答案生成。 测试Agentic RAG让我们通过以下查询来测试:总结2020年加州野火的联邦响应Langchain会输出中间步骤,包括 RAG_Search 函数的输入、搜索结果和最终输出。 )# 使用StructuredTool定义RAG搜索工具rag_search_tool = StructuredTool( name="RAG_Search", func=rag_search
部署集成化 RAG 解决方案与原生智能体平台 为应对上述挑战,腾讯云联合 Elastic 提供了一套从底层基础设施到敏捷上层开发的全链路解决方案,推动应用由传统 RAG 向 Agentic RAG(智能体驱动的 RAG)转型。 统一化搜索平台架构:将原本割裂的多个组件整合为 1 个集成的 RAG 解决方案。 基础设施与技术效能指标: 服务器资源大幅缩减:在“十亿级向量”的 RAG 应用实战中,系统架构由管理 4 个不同系统、400+ 台服务器,精简至单一集成方案仅需 30 台服务器,实现 90%+ 的成本降低 结合 NLP 技术、代码生成与多轮对话能力,为打造原生自主代理(Autonomous Agent)提供了高可用、强安全性的模型底座。
注:绿色元素代表我们将要深入讨论的核心 RAG 技术,蓝色元素则表示文本 模块化 RAG 模块化 RAG结构不仅更加灵活自由,还引入了更多定制化的功能模块,例如查询搜索引擎和多答案整合。 技术上,它将信息检索与微调、强化学习等技术相结合。从流程上看,RAG 的各个模块被精心设计和调配,形成了多种RAG模式。 但模块化 RAG 并非一蹴而就;它是在前两个范式基础上逐步演化而来的。 发展前景 我们可以预见大模型和RAG技术将会共同进步,并可能融合发展。大模型可能会内置更加高效的检索机制,而RAG技术也会不断优化,使得检索过程更加精准、生成过程更加自然。 2、多模态扩展 RAG 的技术和概念正在不断进化,它们将如何扩展到图像、音频、视频或代码等其他数据形式? 目前,包括推荐系统、信息提取和报告生成在内的多种任务已经开始受益于 RAG 技术的应用。 同时,RAG 技术栈也在迅速壮大。
文中附带技术文档,粉丝朋友自行领取。一文让你读懂智能体架构设计。当前AI智能体技术已从单一任务执行向多智能体协同进化。 RAG增强检索解决大模型知识滞后问题的标准架构:# 预处理阶段chunks = split_documents(knowledge_base) embeddings = embed_model.encode 检索增强这块内容,由于文章篇幅有限,我整理了一份详细的技术文档,粉丝朋友自行领取《RAG检索增强》4. Agentic AI协作框架如果将 AI 智能体比作独奏者,那么 Agentic AI 就像是一个交响乐团。 在Agentic AI 系统中,每个 AI 智能体都有其独特的角色和能力,它们可以相互协作、共享信息,并根据任务需求动态调整策略。
核心差异:它们不是同一种技术路线 做法2并不是传统RAG思路,虽然表面上看都是"基于已有文档回答问题",但底层实现逻辑完全不同。 ## 技术建议 如果你想继续优化,可以结合两种方式的优点: 1. **第一轮用RAG快速定位**:找出最相关的20-30篇文章 2. 在技术交流中,如果你说 "Agentic RAG",别人会默认: - 你有向量数据库(Pinecone, Weaviate, Chroma等) - 你在用embedding模型(OpenAI embedding 的技术栈完全不同。 RAG到Agentic RAG本身的一个技术升级。
接下来就跟我一起将 agents 概念引入传统的 RAG 工作流,重新构建自己的 Agentic RAG 系统吧。 在本文中,我会介绍如何使用 Llama-index 实现基本的 Agentic RAG 应用。我将在接下来的几周发布一系列(共四篇)有关 Agentic RAG 架构的文章,本文是这个系列的第一篇。 Agentic RAG 还能使 RAG 系统具有工具调用的能力,并且这些工具可以是自定义函数。 RAG; 在文档集中具有多步推理能力的 Agentic RAG。 下图是本文要实现的路由式查询引擎的基本结构: 项目环境初始化 创建一个名为 agentic_rag 的目录作为本系列文章的项目目录,再在 agentic_rag 内部创建一个名为 basics 的目录作为本文代码实践的工作目录
这篇文章详细探讨了AI智能知识库从传统RAG(检索增强生成)向Agentic模式演进的技术路径。 本章节将深入剖析四种截然不同的技术范式——传统RAG、智能体RAG(Agentic RAG)、图谱RAG(GraphRAG)以及本方法论所采用的“智能体文件系统问答”(Agentic File System 1.2 范式二:智能体RAG(Agentic RAG)——检索过程的智能化升级 Agentic RAG是对传统RAG的一次重要改进。其核心特征是引入了AI智能体(Agent)来优化和编排检索过程。 尽管其底层检索技术大多仍基于向量数据库,但决策的智能化使其能够更深入地探索知识。 一个形象的比喻是: Agentic RAG就像一个会帮你优化检索策略的聪明图书管理员。 System QA > Agentic RAG > GraphRAG > 传统RAG。
❝本文系统介绍静态 RAG 与动态 RAG 的核心原理、技术对比、主流实现方案及代码实践,适合技术选型和深入学习参考。 ❞ 目录 一、RAG 技术概述 二、静态 RAG 2.1 核心原理 2.2 优化技术 2.3 主流实践方案 2.4 代码示例 三、动态 RAG 3.1 核心原理 3.2 主流实现方案 四、Self-RAG 7.1 静态 vs 动态 RAG 7.2 Self-RAG vs CRAG 7.3 选型建议 八、参考资源 一、RAG 技术概述 RAG(Retrieval-Augmented Generation, 3.1 核心原理 动态 RAG(也称 Agentic RAG)是更智能的检索增强方法,核心特点是「按需检索、迭代优化」: ┌────────────────────────────────────── ] # 边定义 } } ) # 列出已有 Agent agents = rag.list_agents() 七、技术对比与选型建议 7.1 静态 vs 动态 RAG 维度
二、Agentic RAG闪亮登场 AgenticRAG就是来解决传统RAG这些痛点的。它在RAG的流程里加了个AI智能体,能像个“指挥官”一样协调检索和生成这两个环节。 简单来说,它打破了传统RAG那种静态单次检索的局限。 关注公众号【阳光宅猿】回复【AIGC】领取最新AI知识文档大全,包含RAG、Agent、模型微调等多种技术!!! 四、Agentic RAG与MCP结合的系统架构 要把Agentic RAG和MCP结合起来,得设计一个合理的架构,让AI智能体可以通过MCP服务器获取知识,再把这些知识融入到生成答案的流程里。 关注公众号【阳光宅猿】回复【AIGC】领取最新AI知识文档大全,包含RAG、Agent、模型微调等多种技术!!! 关注公众号【阳光宅猿】回复【加群】进入技术交流群一起学习成长!!! 关注公众号【阳光宅猿】回复【AIGC】领取最新AI知识文档大全,包含RAG、Agent、模型微调等多种技术!!! 关注公众号【阳光宅猿】回复【加群】进入技术交流群一起学习成长!!! 2.